SEGMENTASI DOKUMEN TEKS DENGAN METODE TEXTTILING
نویسندگان
چکیده
Dalam penelitian ini, kami akan melaporkan pada segmentasi teks dokumen pidato bahasa Indonesia. Sebagai hasil dari penggunaan Automatic Speech Recognition (ASR), ditranskripsi menjadi tanpa batas untuk setiap dokumen. Dokumen-dokumen tersebut tentunya perlu disegmentasi sesuai dengan topiknya. Kami menerapkan metode TextTiling berbagai teknik pembobotan istilah seperti TF-IDF, TF-IDF-Mutual Information, TF-IDF Mutual Information-Word Similarity, dan TF-IDF-Word Frequency mengukur kemiripan antar segmen. Hasilnya menunjukkan Information berkinerja lebih baik di sebagian besar koleksi.
منابع مشابه
Klasifikasi Komponen Argumen Secara Otomatis pada Dokumen Teks berbentuk Esai Argumentatif
Abstrak Dengan pengenalan argumen secara otomatis dari dokumen teks, penulis esai dapat melakukan inspeksi pada teks yang mereka tulis. Hal ini akan membantu penilaian esai secara lebih objektif dan tepat karena penilai esai akan melihat seberapa baik komponen argumentasi terbentuk. Beberapa peneliti mencoba untuk melakukan pendeteksian dan klasifikasi argumen serta penerapannya pada berbagai d...
متن کاملProbabilistic Latent Semantic Analysis (PLSA) untuk Klasifikasi Dokumen Teks Berbahasa Indonesia
Abstrak Salah satu pekerjaan yang ada di dalam mengelola dokumen adalah bagaimana menemukan intisari dari dokumen. Topic modeling merupakan teknik yang dikembangkan untuk menghasilkan representasi dokumen berupa kata-kata kunci dari dokumen. Kata-kata kunci tersebut yang akan digunakan dalam proses pengindeksan serta pencarian dokumen untuk ditemukan kembali sesuai kebutuhan pengguna. Pada pene...
متن کاملKlasifikasi Data Cardiotocography Dengan Integrasi Metode Neural Network Dan Particle Swarm Optimization
Backpropagation (BP) adalah sebuah metode yang digunakan dalam training Neural Network (NN) untuk menentukan parameter bobot yang sesuai. Proses penentuan parameter bobot dengan menggunakan metode backpropagation sangat dipengaruhi oleh pemilihan nilai learning rate (LR)-nya. Penggunaan nilai learning rate yang kurang optimal berdampak pada waktu komputasi yang lama atau akurasi klasifikasi yan...
متن کاملPenambahan emosi menggunakan metode manipulasi prosodi untuk sistem text to speech bahasa Indonesia
Abstrak—Text To Speech (TTS) merupakan suatu sistem yang dapat mengonversi teks dalam format suatu bahasa menjadi ucapan sesuai dengan pembacaan teks dalam bahasa yang digunakan. Fokus penelitian yaitu suatu konsep pengucapan natural, dengan usaha “memanusiakan” pelafalan sintesa suara sistem Text To Speech yang dihasilkan. Kebutuhan utama yang digunakan untuk sistem Text To Speech dalam peneli...
متن کاملTEKS Correlations
TEKS Objective Session Coverage (A) relate the nation's health goals and objectives to individual, family, and community health; (B) examine the relationship among body composition, diet, and fitness; (C) explain the relationship between nutrition, quality of life, and disease; (D) describe the causes, symptoms, and treatment of eating disorders; (E) examine issues related to death and grieving...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: JIF: Jurnal Imiah Informatika
سال: 2022
ISSN: ['2615-1049', '2337-8379']
DOI: https://doi.org/10.33884/jif.v10i01.4509